Apache POI ব্যবহার করে আপনি Microsoft Word ডকুমেন্ট থেকে Paragraph এবং Run (টেক্সটের স্টাইলযুক্ত অংশ) সহ ডেটা পড়তে পারেন। এই লাইব্রেরি আপনাকে Word ডকুমেন্টের মধ্যে Text, Font Style, Font Size, Color, Bold, Italic, Underline ইত্যাদি ফরম্যাটিং তথ্য বের করার সুযোগ দেয়।
এই টিউটোরিয়ালে, আমরা দেখব কিভাবে Paragraph এবং Run থেকে ফরম্যাটিংসহ ডেটা পড়তে হয়।
1. Apache POI ব্যবহার করে Word ডকুমেন্ট থেকে Paragraph এবং Run ডেটা পড়া
Paragraph একটি পুরো প্যারাগ্রাফের প্রতিনিধিত্ব করে এবং Run হলো প্যারাগ্রাফের একটি অংশ, যেখানে টেক্সট এবং তার স্টাইল (যেমন বোল্ড, ইটালিক ইত্যাদি) থাকে।
উদাহরণ: Paragraph এবং Run থেকে ফরম্যাটিং সহ ডেটা পড়া
import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.apache.poi.xwpf.usermodel.XWPFParagraph;
import org.apache.poi.xwpf.usermodel.XWPFRun;
import java.io.FileInputStream;
import java.io.IOException;
import java.util.List;
public class ReadParagraphAndRunExample {
public static void main(String[] args) throws IOException {
// Word ডকুমেন্ট ওপেন করা
FileInputStream fis = new FileInputStream("example.docx");
XWPFDocument document = new XWPFDocument(fis);
// ডকুমেন্টের সব প্যারাগ্রাফ পড়া
List<XWPFParagraph> paragraphs = document.getParagraphs();
for (XWPFParagraph paragraph : paragraphs) {
System.out.println("Paragraph Text: " + paragraph.getText());
// প্যারাগ্রাফের সব Run (স্টাইলযুক্ত টেক্সট) পড়া
List<XWPFRun> runs = paragraph.getRuns();
for (XWPFRun run : runs) {
System.out.println("Run Text: " + run.toString());
System.out.println("Bold: " + run.isBold());
System.out.println("Italic: " + run.isItalic());
System.out.println("Underline: " + run.getUnderline());
System.out.println("Font Size: " + run.getFontSize());
System.out.println("Font Color: " + run.getColor());
}
}
document.close();
fis.close();
}
}
এটি কী করবে:
example.docxফাইলটি ওপেন করবে।- ডকুমেন্টের সব Paragraph পড়বে এবং তাদের টেক্সট প্রদর্শন করবে।
- প্রতিটি Paragraph এর মধ্যে থাকা Run (স্টাইলযুক্ত টেক্সট) থেকে বোল্ড, ইটালিক, আন্ডারলাইন, ফন্ট সাইজ এবং ফন্ট কালারের মতো ফরম্যাটিং ডেটা বের করবে।
2. Font Style, Size এবং Color ফরম্যাটিং ডেটা পড়া
প্রতিটি Run অবজেক্টে Font Style, Font Size, এবং Font Color এর মতো ফরম্যাটিং তথ্য থাকে। আপনি এই তথ্যগুলো দিয়ে টেক্সটের সঠিক স্টাইল সম্পর্কে জানতে পারবেন।
উদাহরণ: Run থেকে Font Style, Font Size এবং Color পড়া
import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.apache.poi.xwpf.usermodel.XWPFParagraph;
import org.apache.poi.xwpf.usermodel.XWPFRun;
import java.io.FileInputStream;
import java.io.IOException;
import java.util.List;
public class ReadFormattingFromRunExample {
public static void main(String[] args) throws IOException {
// Word ডকুমেন্ট ওপেন করা
FileInputStream fis = new FileInputStream("example.docx");
XWPFDocument document = new XWPFDocument(fis);
// ডকুমেন্টের সব প্যারাগ্রাফ পড়া
List<XWPFParagraph> paragraphs = document.getParagraphs();
for (XWPFParagraph paragraph : paragraphs) {
System.out.println("Paragraph Text: " + paragraph.getText());
// প্যারাগ্রাফের সব Run (স্টাইলযুক্ত টেক্সট) পড়া
List<XWPFRun> runs = paragraph.getRuns();
for (XWPFRun run : runs) {
System.out.println("Run Text: " + run.toString());
// Font Style (Bold, Italic, Underline)
System.out.println("Bold: " + run.isBold());
System.out.println("Italic: " + run.isItalic());
System.out.println("Underline: " + run.getUnderline());
// Font Size এবং Font Color
System.out.println("Font Size: " + run.getFontSize());
System.out.println("Font Color: " + run.getColor());
}
}
document.close();
fis.close();
}
}
এটি কী করবে:
- Run অবজেক্টের Font Size, Font Color, এবং Font Style এর তথ্য পড়বে এবং কনসোলে প্রদর্শন করবে।
3. Paragraph Alignment এবং Spacing এর মতো ফরম্যাটিং ডেটা পড়া
আপনি Paragraph এর alignment এবং spacing সম্পর্কিত ফরম্যাটিং ডেটাও পড়তে পারেন।
উদাহরণ: Paragraph Alignment এবং Spacing পড়া
import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.apache.poi.xwpf.usermodel.XWPFParagraph;
import java.io.FileInputStream;
import java.io.IOException;
import java.util.List;
public class ReadParagraphAlignmentSpacingExample {
public static void main(String[] args) throws IOException {
// Word ডকুমেন্ট ওপেন করা
FileInputStream fis = new FileInputStream("example.docx");
XWPFDocument document = new XWPFDocument(fis);
// ডকুমেন্টের সব প্যারাগ্রাফ পড়া
List<XWPFParagraph> paragraphs = document.getParagraphs();
for (XWPFParagraph paragraph : paragraphs) {
// প্যারাগ্রাফের alignment এবং spacing তথ্য পড়া
System.out.println("Paragraph Alignment: " + paragraph.getAlignment());
System.out.println("Paragraph Line Spacing: " + paragraph.getSpacingBetween());
}
document.close();
fis.close();
}
}
এটি কী করবে:
- Paragraph এর Alignment (যেমন Left, Right, Center, Justified) এবং Line Spacing (লাইনগুলোর মাঝে স্পেসিং) সম্পর্কে তথ্য প্রদর্শন করবে।
সারাংশ
Apache POI ব্যবহার করে Word ডকুমেন্ট থেকে Paragraph এবং Run অবজেক্টের মাধ্যমে টেক্সট এবং তার ফরম্যাটিং তথ্য পড়া সম্ভব। আপনি টেক্সটের Font Style (বোল্ড, ইটালিক, আন্ডারলাইন), Font Size, Font Color, Alignment, Spacing সহ অন্যান্য ফরম্যাটিং ডেটা এক্সট্র্যাক্ট করতে পারবেন। এই ফিচারগুলো Word ডকুমেন্টের কনটেন্ট প্রক্রিয়াকরণ এবং বিশ্লেষণের জন্য অত্যন্ত উপকারী।
Read more